0 رای
وضعیت موجودی موجود

قیمت قبلی: 3,140,000 ریال
قیمت: 2,740,000 ریال

 




Product details

  • Publisher ‏ : ‎ Independently published (January 1, 2020)
  • Language ‏ : ‎ English
  • Paperback ‏ : ‎ 234 pages
  • ISBN-10 ‏ : ‎ 165206463X
  • ISBN-13 ‏ : ‎ 978-1652064633



 

خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

Available at a lower price from other sellers that may not offer free Prime shipping.
 
 
 

Putting predictive models into production is one of the most direct ways that data scientists can add value to an organization. By learning how to build and deploy scalable model pipelines, data scientists can own more of the model production process and more rapidly deliver data products.

This book provides a hands-on approach to scaling up Python code to work in distributed environments in order to build robust pipelines. Readers will learn how to set up machine learning models as web endpoints, serverless functions, and streaming pipelines using multiple cloud environments. It is intended for analytics practitioners with hands-on experience with Python libraries such as Pandas and scikit-learn, and will focus on scaling up prototype models to production.

From startups to trillion dollar companies, data science is playing an important role in helping organizations maximize the value of their data. This book helps data scientists to level up their careers by taking ownership of data products with applied examples that demonstrate how to:

  • Translate models developed on a laptop to scalable deployments in the cloud
  • Develop end-to-end systems that automate data science workflows
  • Own a data product from conception to production

The accompanying Jupyter notebooks provide examples of scalable pipelines across multiple cloud environments, tools, and libraries (github.com/bgweber/DS_Production).

Book Contents

Here are the topics covered by Data Science in Production:

  • Chapter 1: Introduction - This chapter will motivate the use of Python and discuss the discipline of applied data science, present the data sets, models, and cloud environments used throughout the book, and provide an overview of automated feature engineering.
  • Chapter 2: Models as Web Endpoints - This chapter shows how to use web endpoints for consuming data and hosting machine learning models as endpoints using the Flask and Gunicorn libraries. We'll start with scikit-learn models and also set up a deep learning endpoint with Keras.
  • Chapter 3: Models as Serverless Functions - This chapter will build upon the previous chapter and show how to set up model endpoints as serverless functions using AWS Lambda and GCP Cloud Functions.
  • Chapter 4: Containers for Reproducible Models - This chapter will show how to use containers for deploying models with Docker. We'll also explore scaling up with ECS and Kubernetes, and building web applications with Plotly Dash.
  • Chapter 5: Workflow Tools for Model Pipelines - This chapter focuses on scheduling automated workflows using Apache Airflow. We'll set up a model that pulls data from BigQuery, applies a model, and saves the results.
  • Chapter 6: PySpark for Batch Modeling - This chapter will introduce readers to PySpark using the community edition of Databricks. We'll build a batch model pipeline that pulls data from a data lake, generates features, applies a model, and stores the results to a No SQL database.
  • Chapter 7: Cloud Dataflow for Batch Modeling - This chapter will introduce the core components of Cloud Dataflow and implement a batch model pipeline for reading data from BigQuery, applying an ML model, and saving the results to Cloud Datastore.
  • Chapter 8: Streaming Model Workflows - This chapter will introduce readers to Kafka and PubSub for streaming messages in a cloud environment. After working through this material, readers will learn how to use these message brokers to create streaming model pipelines with PySpark and Dataflow that provide near real-time predictions.

Excerpts of these chapters are available on Medium (@bgweber), and a book sample is available on Leanpub.

 

خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

کد محصول VYWU7662900

منابع کتاب خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

 

 

با قیمت پایین‌تری از سایر فروشندگانی که ممکن است ارسال رایگان Prime را ارائه ندهند، موجود است.

 
 
 

قرار دادن مدل‌های پیش‌بینی در تولید یکی از مستقیم‌ترین راه‌هایی است که دانشمندان داده می‌توانند به یک سازمان ارزش بیافزایند. با یادگیری نحوه ساخت و استقرار خطوط لوله مدل مقیاس پذیر، دانشمندان داده می توانند بیشتر فرآیند تولید مدل را در اختیار داشته باشند و محصولات داده را با سرعت بیشتری تحویل دهند.

این کتاب یک رویکرد عملی برای افزایش مقیاس کد پایتون برای کار در محیط های توزیع شده به منظور ایجاد خطوط لوله قوی ارائه می دهد. خوانندگان یاد می‌گیرند که چگونه مدل‌های یادگیری ماشین را به‌عنوان نقاط پایانی وب، عملکردهای بدون سرور و خطوط لوله جریانی با استفاده از چندین محیط ابری تنظیم کنند. این برای متخصصان تجزیه و تحلیل با تجربه عملی با کتابخانه‌های پایتون مانند پانداها و scikit-learn در نظر گرفته شده است و بر مقیاس‌سازی مدل‌های نمونه اولیه تا تولید تمرکز دارد.

از استارت آپ ها گرفته تا شرکت های تریلیون دلاری، علم داده نقش مهمی در کمک به سازمان ها برای به حداکثر رساندن ارزش داده های خود ایفا می کند. این کتاب به دانشمندان داده کمک می‌کند تا با در اختیار گرفتن مالکیت محصولات داده‌ای با مثال‌های کاربردی که نشان می‌دهند چگونه مشاغل خود را ارتقا دهند:

  • مدل‌های توسعه‌یافته در لپ‌تاپ را به استقرارهای مقیاس‌پذیر در فضای ابری ترجمه کنید
  • سیستم های سرتاسری را توسعه دهید که گردش کار علم داده را خودکار می کند
  • از زمان تصور تا تولید، صاحب یک محصول داده باشید

نوت‌بوک‌های همراه Jupyter نمونه‌هایی از خطوط لوله مقیاس‌پذیر را در چندین محیط ابری، ابزارها و کتابخانه‌ها ارائه می‌کنند ( github.com/bgweber/DS_Production ).

مطالب کتاب

در اینجا موضوعات تحت پوشش علم داده در تولید آمده است :

  • فصل 1: مقدمه - این فصل انگیزه استفاده از پایتون را ایجاد می‌کند و در مورد رشته علم داده کاربردی بحث می‌کند، مجموعه داده‌ها، مدل‌ها و محیط‌های ابری مورد استفاده در سراسر کتاب را ارائه می‌کند و یک نمای کلی از مهندسی ویژگی‌های خودکار ارائه می‌دهد.
  • فصل 2: ​​مدل‌ها به عنوان نقاط پایانی وب - این فصل نحوه استفاده از نقاط پایانی وب برای مصرف داده‌ها و میزبانی مدل‌های یادگیری ماشین را به عنوان نقاط پایانی با استفاده از کتابخانه‌های Flask و Gunicorn نشان می‌دهد. ما با مدل‌های یادگیری scikit شروع می‌کنیم و همچنین یک نقطه پایانی یادگیری عمیق را با Keras تنظیم می‌کنیم.
  • فصل 3: مدل‌ها به‌عنوان توابع بدون سرور - این فصل بر اساس فصل قبل استوار است و نحوه تنظیم نقاط پایانی مدل را به‌عنوان توابع بدون سرور با استفاده از توابع AWS Lambda و GCP Cloud نشان می‌دهد.
  • فصل 4: کانتینرها برای مدل‌های تکرارپذیر - این فصل نحوه استفاده از کانتینرها برای استقرار مدل‌ها با Docker را نشان می‌دهد. همچنین افزایش مقیاس با ECS و Kubernetes و ساخت برنامه های وب با Plotly Dash را بررسی خواهیم کرد.
  • فصل 5: ابزارهای گردش کار برای خطوط لوله مدل - این فصل بر برنامه ریزی گردش کار خودکار با استفاده از جریان هوای آپاچی تمرکز دارد. ما مدلی را راه‌اندازی می‌کنیم که داده‌ها را از BigQuery می‌کشد، مدلی را اعمال می‌کند و نتایج را ذخیره می‌کند.
  • فصل 6: PySpark برای مدل سازی دسته ای - این فصل خوانندگان را با PySpark با استفاده از نسخه جامعه Databricks آشنا می کند. ما یک خط لوله مدل دسته ای خواهیم ساخت که داده ها را از یک دریاچه داده می کشد، ویژگی ها را تولید می کند، یک مدل را اعمال می کند و نتایج را در یک پایگاه داده بدون SQL ذخیره می کند.
  • فصل 7: Cloud Dataflow برای Batch Modeling - این فصل اجزای اصلی Cloud Dataflow را معرفی می‌کند و خط لوله مدل دسته‌ای را برای خواندن داده‌ها از BigQuery، اعمال یک مدل ML و ذخیره نتایج در Cloud Datastore پیاده‌سازی می‌کند.
  • فصل 8: جریان کار مدل های جریانی - این فصل خوانندگان را با Kafka و PubSub برای پخش پیام ها در یک محیط ابری آشنا می کند. پس از کار بر روی این مطالب، خوانندگان یاد خواهند گرفت که چگونه از این کارگزاران پیام برای ایجاد خطوط لوله مدل جریان با PySpark و Dataflow استفاده کنند که پیش‌بینی‌های تقریباً هم‌زمان را ارائه می‌کنند.

گزیده‌هایی از این فصل‌ها در Medium (@bgweber) و نمونه کتاب در Leanpub موجود است.

 

نظرات کاربران درباره خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

نظری در مورد این محصول توسط کاربران ارسال نگردیده است.
اولین نفری باشید که در مورد خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber نظر می دهد.

ارسال نظر درباره خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

لطفا توجه داشته باشید که ایمیل شما منتشر نخواهد شد.

برچسب های مرتبط با خرید اینترنتی کتاب Data Science in Production: Building Scalable Model Pipelines with Python اثر Ben G Weber

web development

بر اساس سلیقه شما...

codebazan

طراحی و اجرا: فروشگاه ساز سبدخرید